第 3 回 


回 は , ビヘイビア 合成 の 処理 順に つい て 解説 する . ビ ヘ へ 
イ ビ ア 合成 で は , ビヘイビア ・ モ デル に クロ ッ ク ・ サ イク ル 
を 導入 し た り , クロ ッ ク ・ サ イク ル を また いで 演算 リソー ス 
を 移動 させ る こと に よっ て , 面積 や 性 能 ( ク ロッ ク 周 期 や レイ 
テン シ ジ ) の 最適 化 を 図る . ビヘイビア 合成 の 処理 その も の は 入 
力 言語 に 依存 し な い . SystemC で も HDL で も ほぼ ば ぼ 同 じ 処理 
手順 を と る . (編集 部 ) 


前 回 は , ビヘイビア 合成 で 用 いる SystemC 構 文 に つい て 


図 1 

ビヘイビア 合成 の 基本 処理 ス 
テッ プ 
ビヘイビア 合成 の 基本 的 な 処理 
ステ ッ プ を 示す . それ ぞ れ の ビ 
ヘイ ビア 合成 ツー ル に よっ て 処 
理 順序 や 内 容 に 若干 の 違い は あ 
る が, 基本 的 な 処理 ステ ッ プ に 
大 き な 差 は な い . 


レジ スタ ・ バ イン ディ ング 図 


出力 処理 較 
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デバ イス の 記事 


SystemC に まる 


や 
4)/) 


が 


紹介 し まし た . ビヘイビア 合成 で 用 いる SystemC 構 文 は , 
BCA bus cycle accurate: バス ・ サ イク ル 精 度 ) モ デル に 
基づい て , ビヘイビア 合成 の 対象 と な る C/C++ ア ル ゴ リ 
ズム と 外部 シス テム を 接続 する 入出 力 イ ンタ ー フ ェ ー ス , 
お よび それ に 伴う クロ ッ ク ・ サ イク ル 動 作 を 定義 する た め 
の も の と 言え ます . その た め , アル ゴリ ズム と 外部 の ハー 
ドウ ェ ア ・ シ ステ ム を 接続 する ラッ パ を 作成 する こと と 見 
な すこ と も で きま す . 

今回 は , ビヘイビア 合成 の 基本 的 な 処理 フロ ー と それ ぞ 
れ の 処理 ステ ッ プ に つい て 紹介 し ます . 


信 一 連 の 手順 で ビヘイビア 記述 を RTL 記 述 に 変換 

図 1 に , 標準 的 な ビヘイビア 合成 の 処理 ステ ッ プ を 示し 
ます . それ ぞ れ の ビヘイビア 合成 ツー ル に よっ て 処理 順序 
や 内 容 が 異な る 場合 が あり ます が , 基本 的 な ステ ッ プ に は 
あま り 大 き な 差 は あり ませ ん . 

まず は , C++ コ ン パ イラ に 基づい た 文法 チェ ッ ク 処 理 と 
演算 アル ゴリ ズム の 最適 化 を 行い , 入力 記述 の コン トロ 
ー ル ・ デ ー タ ・ フ ロー を 解析 し ます . 論理 合成 で も 同じ よ 
うな 処理 を 行い ます が , ビヘイビア 記述 は RTI( register 
transfer level) 記述 と 比べ て 抽象 度 が 高く , より 少な い コ 
ー ド で 機能 を 記述 で きま す . 

次 に , 演算 子 の 実現 に 必要 な 演算 リソー ズ 加算 器 , 乗 
算 器 な ど ) の 作成 , また は ライ ブラ リ から の 選択 を 行い, リ 
ソー ス ・ ア ロケ ーション ( resource allocation) を 行っ た 後 , 
クロ ッ ク 周 期 や レイ テン シ な どの タイ ミン グ 制 約 条 件 と , 
演算 リソー ス の 持つ タイ ミン グ 遅 延 値 に 従っ て スケ ジュ ー 
リン グ を 実行 し ます . 

スケ ジュ ー リ ング は , 演算 リソー ス の 持つ タイ ミン グ と 
クロ ッ ク 周 期 に 依存 し ます . 例え ば , 図 2 に 示し た よう に 


L 


図 2 ッ ー (a+b) xc: 加算 器 の 遅延 が 5ns, 乗算 器 が 10ns の 場合 図 


タイ ミン グ に よる スケ ジュ ー リ ング の 違い 


スケ ジュ ー リ ング 結果 は , クロ ッ ク 周 期 と 演算 
リソー ス が 持つ 入出 力 遅延 に 依存 する . y ニ 
(a 十 b) *c と いう 式 に 対し て , 加算 器 の 遅延 が 
5ns, 乗算 器 が 10ns と する と , クロ ッ ク 周 期 
20ns で は 1 サイ クル で 加算 と 乗算 を 実行 で き 
る . 周期 10ns で は 加算 と 乗算 が それ ぞ れ 別 の 
サイ クル で 実行 され , 2 サイ クル と な る . 周期 
5ns で は パイ プラ イン 乗算 器 が 必要 に な り , 合 
計 3 サ イク ル と な る . 


( a) クロ ッ ク が 20ns 


リス ト 1 ビヘイビア 合成 を 実行 する 記述 例 


typedef so uint<8> u1n8: 
BC_utn セ <33> exxample funo( 
uin8 a, uint8 b, uint8 oc, unt8 d, uint8 e ) 


{ 


BC_u1n セ <33> : 
Y= ( (aa* や も)+C)D* (d*e)z: 
return Y: 


) 


= (a+ D) * C: 


と いう 式 で , 加算 器 の リソー ス の 持つ 最大 遅延 値 が 5ns, 
乗算 器 の 最大 遅延 値 が 10ns で ある と する と , クロ ッ ク 周 期 
が 20ns の 場合 , 加算 と 乗算 を 一 つの クロ ッ ク ・ サ イク ル で 
実行 で きま す . クロ ッ ク 周 期 が 10ns で あれ ば , 加算 と 乗算 
を 別々 の サイ クル で 実行 する 必要 が あり ます . クロ ッ ク 周 
期 が 5ns で あれ ば , 乗算 処理 を パイ プラ イン 化し た パイ プ 
ライ ン 乗 算 器 を 用 いて 合計 3 サイ クル で 演算 を 実行 し ます . 
E 確 な スケ ジュ ー リ ング を 実行 する に は , 正確 な 演算 リ ソ 
ー ス の 遅延 値 を 求め る 必要 が あり ます . 

次 に , スケ ジュ ー リ ング の 結果 に 従っ て , 演算 リソー ス 
と レジ スタ に 対す る 共有 化 と バイ ン デ ィング binding) を 行 
いま す . そし て , 最後 に ビヘイビア 合成 の 出力 デー タ と し 
て , デー タパス 部 と ステ ー ト ・ マ シン 部 で 構成 され た RTL 
記述 を 生成 し ます . RTL 記 述 を SystemC ユ コー ド と し て 生成 
し た 場合 , OSCI Open SystemC Initiative: SystemC の 
標準 化 / 普 及 推 進 組織 ) の リフ ァ レ ンス ・ シ ミュ レー タ を 用 
いて シミ ュ レ ーション する こと が で きま す . また , RTL 記 
述 を 論理 合成 可能 な Verilog HDL コー ド また は VHDL コ ー 
ド と し て 生成 し た 場合 , その 後 , 論理 合成 を 実行 し て , 既 
存 の 設計 フロ ー へ 進む こと が で きま す . 

SystemC は クロ ッ ク の 概念 を 持っ て いま す . その た め , 
SystemC と HDL の 混在 が 可能 な シミ ュ レ ー タ を 使用 し た 
場合 , 同一 の SystemC テ スト ベン チ を 用 いて ビヘイビア 検 


皿 


乗算 器 図 


( b) クロ ッ ク が 10ns ( c) クロ ッ ク が 5ns 


表 1 SystemC/C++ サ ポー ト 構文 

モジ ュー ル , スレ ッ ド C++ 構 文 

SC_MODULE すべ て の C++ 演算 子 
配列 メン バ / ロ ー カ ル 変 数 
if/e1se 構 文 

ポト for () ルー プ ,whi1e () ルー プ 
SC_1 ロ <> gwitoh () 構文 
BC_Ou ヒ <> ポイ ンタ お よび 参照 
ポー ト ・ タ イプ クラ ス お よび クラ ス ・ テ ンプ レー ト の 

poo1 イン スタ ンス 化 
SC_1n ヒ <> ファ ンク ショ ン ・ テ ンプ レー ト 
SC_U1n ヒ <> 継承 
演算 子 の オー バロー ド 


SC_ CTHREAD 


watching ( ) 


SC_b191n ヒ <> 


SC_b1du1n ヒ <> 


SC_fF1xed<> 


証 と HDL に よる RTL 検 証 の 両方 を 実行 する こと が で きま 
す . ビヘイビア ・ シ ミュ レー ショ ン の 実行 結果 と RTL シ ミ 
ュ レ ーション の 実行 結果 を 比較 し て , 機能 が 一 致し て いる 
か どう か を 確認 で きま す *. 


⑯ ビヘイビア 合成 を 構成 する 九 つ の 処理 ステ ッ プ 
以下 , 各 処 理 ス テッ プ に 対し て も う 少 し 詳細 な ビ ヘ イ ビ 
ア 合 成 の 手順 を 紹介 し ます . また , 実際 の 処理 例 と し て , 
リス ト 1 に 示し た 記述 を 含め て 紹介 し ます . 
1) 文法 処理 
文法 処理 の ステ ッ プ で は , C++/SystemC の ビヘイビア 
記述 が ビヘイビア 合成 可能 か どう か を チェ ッ ク し , デー タ 
構造 を ビヘイビア 合成 ツー ル が 定義 せ する フォ ー マ ッ ト に 合 
わせ て 変換 し て , 内 部 デー タベース に 格納 し ます . 文法 処 
理 で は , 一 般 的 に C++ コ ン パ イラ の 技術 を 流用 し て いま す . 


注 : 論理 合成 の 前 後 で RTL の 設計 デー タ と ゲー ト ・ レ ベル の 設計 デー タ を 
静 的 に 比較 する 技術 と し て , フォ ー マ ル ・ ベ リフ ィ ケ ーション ( 形式 的 
検証 ) が 利用 され て いる . ビヘイビア ・ レ ベル を 対象 と する フォ ー マ ル ・ 
ベリ フィ ケー ショ ン 技 術 は , まだ , 研究 段階 に ある . その た め , ビ ヘ イ 

ビア 合成 の 前 後 で 機能 が 一 致し て いる か どう か は , シミ ュ レ ーション に 
よっ て 確認 する 必要 が ある . 
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OSCI の ビヘイビア 合成 の サブ 標準 化 委員 会 で は , ビ へ 
イ ビ ア 合成 可能 な 構文 や 記述 スタ イル の 標準 化 を 行っ て い 
ます . 表 1 に ビヘイビア 合成 可能 な 標準 的 な C++/SystemC 
構文 を 示し ます . ポイ ンタ , 参照 , class, gsEruo, 
template, オー バロー ド な どの 構文 が サポ ー ト され て い 
まず 具体 的 な サポ ー ト 構文 と 記述 例 は , 次 回 以降 で 紹介 
し て いく ). 

2) アル ゴリ ズム 最適 化 

アル ゴリ ズム 最適 化 の ステ ッ プ で は , 記述 内 の 定数 の 伝 
搬 や 保持 , サブ 式 の 共通 化 な どの 処理 を 行い ます . C++ 構 
文 に 対す る いく つか の 処理 は , アル ゴリ ズム 最適 化 の 段階 
で 行わ れ ま す . 例え ば , Eor ル ー プ や while ルー プ な どの 
ルー プ 文 は , その まま で は イン デック ス ご と に 順序 的 に 処 
理 さ れ て し まい ます . し か し , ルー プ の 展開 を 指示 する こ 
と で , 演算 処理 を 並列 化す る こと が で きま す . また , 配列 
を メモ リ と し て 実現 する か , ビッ ト を 展開 し て レジ スタ と 
し て 実現 する か な どの 処理 が 行わ れ ま す . 

3) コン トロ ー ル ・ デ ー タ ・ フロ ー 解 析 

ゴツ トロ 一 ルル ・ データ * ウロ ー 餅 伯 の ステ デップ で は 。、 コ 
ント ロー ル ・ デ ー タ ・ フ ロー・ グ ラフ ( CDFG: control 
data flow graph) を 構築 し て , 入力 と 出力 の 間 の 演算 や デ 
ー タ の 依存 性 の 情報 を 抽出 し ます . コン トロ ー ル ・ デ ー 
タ ・ フ ロー・ グ ラフ は , 出力 が どの よう な 手順 に 従っ て 計 


ンー ネー ロー ショッ | 


出力 処理 図 


( a) 対応 する 処理 ステ ッ プ 較 

図 3 コン トロール ・ デ ー タ ・ フロ ー 解 析 の 結果 例 

演算 式 や 条件 文 の 構造 を 解析 し , コン トロール ・ デ ー タ ・ フ ロー・ グ ラ 
ズ CDFG) を 生成 する . リス ト 1 に 示し た exxamp1e func() を 解析 し た 
結果 , 図 に 示し た よう な CDFG 構 造 が 得 ら れる . 図 中 の 数 値 は 演算 に 必 
要 な ビッ ト 数 を 示す . 条件 分 岐 を 含む 場合 , 条件 分 けし た フロ ー を 含む 
CDFG が 構築 され る . 
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算 さ れる か を 示す 内 部 的 な フロ ー・ グ ラフ で , タイ ミン グ 
情報 は 含み ませ ん . 

リス ト 1 に 示し た 式 が か ら コ ント ロー ル ・ デ ー タ ・ フ ロー・ 
グラ フ を 構築 し た 例 を 図 3 に 示し ます . 出力 が どの よう な 
手順 や 演算 に よっ て 計算 され る か を 示す グラ フ が 構築 され 
て いま す . この 例 で は 条件 分 岐 が 含ま れ て いま せん が , 条 
件 分 岐 が ある 場合 は , 条件 分 岐 を 含め の た グラ フ が 構築 され 
ます 。 
4) ライ ブラ リ 処理 

ビヘイビア 合成 で 生成 し た RTL 記 述 を 論理 合成 する 際 
に , で きる だ け タ イミ ング ・ エ ラー が 生じ な いよ うに する 
た め , ビヘイビア 合成 の 段階 か ら あ る 程度 タイ ミン グ を 考 
慮 する 必要 が あり ます . な ぜ な ら , ビヘイビア 合成 に よっ 
て 生成 され た RTL 記 述 が , 論理 合成 時 に タイ ミン グ の 問題 
を 起こ し て も , 自動 的 に 生成 され た RTL 記 述 を 人 手 で 修正 
する こと は ほとん ど 不 可能 だ か ら で す . 

デー タパス 回 路 を 構成 する 演算 リソー ス に つい て は , タ 
ー ゲ ッ ト の テク ノロ ジ を 用 いて 論理 ゲー ト ・ レ ベル の ネッ 
トリ スト に マッ ピン グ す る こと で , ある 程度 正確 な タイ ミ 
ング と 面積 を 計算 で きま す . 論理 ゲー ト で 構成 され た 演算 
リソー ス は , 入出 力 遅 延 が 小さ けれ ば 面積 が 大 きく な り , 
面積 が 小さ けれ ば 遅延 値 が 大 きく な り ま す . つま り , 遅延 
値 と 面積 の 間 に は トレ ー ド オフ の 関係 が あり ます . その た 


文法 処理 ファ ンク ショ ン 凶 


乗算 器 : 8* 8=16 


アル ゴリ ズム 最適 化 較 加算 器 : 16+16=17 


乗算 器 : 20*20 =40 


Y 8 
コン トロ ー ル ・ デ ー タ ・ フロ - 解 axa=b, a+a=b: a は 入力 の , b は 出力 の b 


ビッ ト 幅 を 示す 図 


/ 
ライ ブラ リ 処理 較 ( b) 必要 な 演算 リソー ス と その 遅延 , 面積 情報 【 


Y 


り め 鈴 1 ァ ア ロケーション 演算 リソー ス 層 


Y 8* 8=16 


スケ ジュ ー リ ング [( ] 16+16=17 


20*20 =40 
合 計 避 


演算 ユニ ッ ト ・ バ イン ディ ング 


Y 

出力 処理 図 
( a) 対応 する 処理 ステ ッ プ 攻 
図 4 ライ ブラ リ 処理 と リソー ス ・ ア ロケ ーション 
図 3 の 演算 に 対応 し て , 論理 ゲー ト ・ レ ベル で 表現 され た 演算 リソー ス を 作成 す 
る か , すでに 用 意 さ れ た ライ ブラ リ か ら 演算 リソー ス を 選択 する . 目標 と する 
クロ ッ ク 周 期 が 10ns と する と , それ ぞ れ の リソー ス の 遅延 値 は 10ns の 条件 を 満 
足し て いる . さら に , 初期 的 な アロ ケー ショ ン に よる 合計 面積 を 示す . 


め , ライ ブラ リ と し て , 一 つの 演算 子 に 対し て 高速 タイ プ 
や 小 面積 タメ イプ な ど , 複数 の 演算 リソー ス が 用 意 さ れ て い 
ます . 後 処理 の スケ ジュ ー リ ング と バイ ン デ ィング で は , 
これ ら の 演算 リソー ス の 中 か ら 所 望 の 特性 を 持つ も の を 選 
択 し ます . 

ライ ブラ リ 処理 の ステ ッ プ で は , 演算 子 に 対応 し た 演算 
リソー ス を 作成 し た り , すでに 用 意 さ れ た 回 路 ラ イブ ラリ 
の 中 か ら 必 要 な 演算 リソー ス を 選択 し た り し ます . 図 4 に , 
図 3 に 示し た グラ フ を 実現 する た め に 必要 な 演算 リソー ス 
と その 遅延 値 , お よび 面積 を 示し ます . 
5) リソー ス ・ ア ロケ ーション 

リソー ス ・ ア ロケ ーション の ステ ッ プ で は , 演算 子 に 対 
し て それ を 実現 する 演算 リソー ス の アロ ケー ショ ン ( 割り 
付け ) を 行い ます . まず , スケ ジュ ー リ ング の 実施 に 必要 
な 初期 的 な アロ ケー ショ ン を 行い ます . この 初期 的 な アロ 
ーション で 決ま っ た 演算 リソー ス の 割り 付け は , 以降 の 
処理 ステ ッ プ で ある スケ ジュ ー リ ング や バイ ン デ ィング の 
段階 で 逐次 変更 され て いき ます . 


ざ 


( b) コン トロ ー ル ・ デ ー タ ・ フ ロー・ 較 
グラ フ 較 


出力 処理 較 
( a) 対応 する 処理 ステ ッ プ 較 


演算 リソー ス 図 サイ クル 1 | サイ クル 2 | サイ クル 3 


_ t1=a*b 凶 
8*8 =16 12 ニ dxe 較 
16+16=17 ー 凶 t3=t1 十 c 
20* 20=40 ー 凶 ー 図 y ニ t2*t3 


合 計 図 


( c) 処理 結果 図 


図 5 最初 の スケ ジュ ー リ ング の 結果 例 


3 サイ クル で 実現 する よう に 制約 を 与え る と , 例え ば 図 に 示し た よう な 最初 
の スケ ジュ ー リ ング 結果 が 得 ら れる . 


6) スケ ジュ ー リ ング 

スケ ジュ ー リ ング の ステ ッ プ で は , クロ ッ ク 周 期 や レイ 
テン シシ ( クロ ッ ク ・ サ イク ル 数 )、 ス ルー プッ ト な どの タイ 
ミン グ 制 約 を コン トロ ー ル ・ デ ー タ ・ フ ロー・ グ ラフ に 与 
えて , その 制約 を 満た す 範 囲 内 で 実現 可能 な クロ ッ ク ・ サ 
イク ル を 求め ます . スケ ジュ ー リ ング で は , 設定 され た 制 
約 に 対し て 最適 な 構成 を 見 つけ る た め に , 記述 コー ド の 移 
動 や 再 順序 化 を 行い ます . スケ ジュ ー リ ング の 結果 は , 演 
算 リ ソー ス を 最小 化し な が ら 制約 を 満足 する , サイ クル 精 
度 の デー タ ・ フ ロー・ グ ラフ に な り ま す . 

ビヘイビア 合成 で 与え る タイ ミン グ 制 約 の 情報 は , ユー 
ザ が 指定 し ます . 与え られ る タイ ミン グ 制 約 は , クロ ッ ク 
周期 だ け で な く , 必要 に 応じ て , 入力 か ら 出力 まで の レイ 
テン シ や 入力 信号 の 遅れ 時 間 , 要求 され る 出力 遅延 な ど を 
指定 し ます . 

ビヘイビア 合成 と 論理 合成 で 大 きく 異な る 処理 が , スケ 
ジュ ー リ ング で す . スケ ジュ ー リ ング に よっ て , 複数 の 
RTL 記 述 を 容易 に 生成 する こと が で きま す . その 結果 , ビ 
ヘイ ビア 合成 に は , RTL 設 計 で は 非常 に 困難 だ っ た , クロ 
ッ ク 周期 や テク ノロ ジ の 変更 を 伴う 設計 資産 の 再 利用 が 容 
易 に 行え る と いう 利点 が あり ます . 


サイ クル 1 サイ クル 2 サイ クル 3 
( a) コン トロ ー ル ・ デ ー タ ・ フ ロー・ グ ラフ 図 


演算 リソー ス 避 サイ クル 2 | サイ クル 3 


8*8=16 t2=d*e 
16+16=17 t3=t1 十 c 


20* 20=40 ー 較 y ニ t2*t3 
合 計 図 


( b) 処理 結果 図 
図 6 演算 リソー ス を 移動 し た スケ ジュ ー リ ング の 結果 
d*e 演 算 を サイ クル 2 に 移動 し て も 演算 結果 が 変わ ら な い の で 移動 させ た . こ 
れ に より , サイ クル 1 に お ける 同一 サイ クル の 二 つ の 8*8 演 算 が な く な り , 
8*8 の 乗算 器 を 一 つ 削除 する こと が で きる . スケ ジュ ー リ ング で は , 演算 子 
を 実行 する サイ クル を 変更 する こと で , 演算 リソー ス の 共有 化 を 図る . 
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ライ ブラ リ 処理 図 


サイ クル 1 サイ クル 2 サイ クル 3 
( b) コン トロ ー ル ・ デ ー タ ・ フ ロー・ 罰 
グラ フ 較 


( a) 対応 する 処理 ステ ッ プ 凶 


演算 リソー ス 図 サイ クル 1 | サイ クル 2 | サイ クル 3 
16+16=17 ー 図 | t3=t1+c ー 較 
20*20=40 t1=a*b t2=d*e | y=t2*t3 27,692 

合 計 図 29.132 
( c) 処理 結果 較 
図 7 バイ ン デ ィング に よる 演算 リソー ス の 共有 化 
バイ ン デ ィング ・ プ ロ セ ス で は , 演算 の ファ ンク ショ ン ・ ユ ニッ ト に 対し て 
リソー ス ・ コ ン ポ ー ネ ン ト を 割り 付ける. 8*8 の 乗算 に 対し て 20*20 の 乗算 
器 が 使用 可能 な た め , 20*20 演 算 を バイ ン デ ィング する こと で さら に 面積 を 
削減 で きる . 


図 5 に 初期 スケ ジュ ー リ ング の 結果 を , 図 6 に 演算 サイ 
クル を 移動 させ た スケ ジュ ー リ ング 結果 を 示し ます . 図 6 
で は , サイ クル 1 で 実施 し て いた 二 つ の 乗算 の うち の 一 つ 
を 2 番目 の サイ クル に 移動 する こと で , 乗算 リソー ス の 数 
を 減ら し て いま す . 同じ 機能 を 保ち な が ら , 必要 な 演算 子 
が 最小 に な る よう に , 演算 の 実行 サイ クル を 移動 させ て い 
く ので す . 

7) 演算 エニ ッ ト ・ バ イン ディ ング 

演算 ユニ ッ ト ・ バ イン ディ ング の ステ ッ プ で は , スケ ジ 
ュー リン グ さ れ た 結果 に 対し て , ライ ブラ リ の 中 の 演算 リ 
ソー ス の どれ を 使用 する の か を 確定 し て いき ます . どの サ 
イク ル で どの 演算 を 実行 し て いる の か を 判断 し , 異な る サ 
イク ル 間 の 演算 を 共有 化し た り , 可能 な 限り 同一 の 演算 リ 
ソー ス を 用 いる よう に し ます . さら に , タイ ミン グ を 満足 
する 範囲 で , より 面積 の 小さ い 演算 リソー ス に 置き 換え た 
好 し ます 。 

図 7 で は , 88 の 乗算 と 20*20 の 乗算 が 同じ サイ クル で 実 
行 さ れ て いな いた め , 8*'8 の 乗算 器 の 代わ り に 2O 20 の 乗算 
器 を 使用 する こと で 乗算 リソー ス の 数 を 減ら し て いま す . 
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文法 処理 較 


アル ゴリ ズム 最適 化 凶 


コン トロ ー ル ・ デ ー タ ・ フ ロー 解 4 


ライ ブラ リ 処 理 図 
スケ ジュ ー リ ング 図 


バイ ン デ ィング 了 全 


愉 


イン ディ ング 例 


出力 処理 較 


( a) 対応 する 処理 ステ ッ プ 凶 


ステ ー ト ・ マ シズ FSM) 較 


20* 20= 40 


( b) 処理 結果 較 


図 8 生成 され た RTL 記 述 の 回 路 構造 


デー タパス 部 と , デー タパス 部 の マル チ プ レク サ を 制御 よる ステ ー ト ・ マシ 
ン 部 か ら 構 成 さ れる RTL 記 述 が 生成 され る . 


8) レジ スタ ・ バ イン ディ ング 

異な る クロ ッ ク ・ サ イク ル の 間 で 使用 する 変数 は , レジ 
スタ に 保持 され な けれ ば な り ま せん . レジ スタ ・ バ イン デ 
ィング の ステ ッ プ で は , レジ スタ に 値 が 書き 込ま れ , その 
値 が 実際 に 演算 な ど に 使用 され る まで の クロ ッ ク ・ サ イク 
これ を 「 ライ フタ イム 」 と 呼ぶ ) を 解析 し , その 結果 に 
基づい て で きる だ け レ ジス タ を 共有 化し て いき ます . レジ 
スタ の ライ フタ イム を うま く 組み 合わ せ て , 必要 な レジ ス 
タ 数 を 最小 化し ます . 

例え ば , 図 7 に 含ま れ て いる t1, t2, t3 の 値 は , レジ ス 
タ へ の 書き 込み が 行わ れ た 次 の サイ クル で 使用 され る た め , 
ライ フタ イム は 1 サイ クル で す . t2, t3 は 同じ クロ ッ ク ・ 
サイ クル で 書き 込ま れる た め , 共有 化 で きま せん . し か し , 
t1 と t2 は 異な る サイ クル で 使用 され る た め , 共有 化 で き 


RE 


91o】 軸 7 


ビヘイビア 合成 で 生成 し た RTL 記 述 の 面積 や 性 能 クロ ッ ク 周 期 や 
レイ テン シ ) が , 人 手 で 作成 し た RTL 記 述 の それ に 忠 が する か どう か 
は , 多く の 設計 者 が 興味 を 持っ て いる ポイ ント だ と 思い ます . し か 
し , この 質問 に 対す る 回 答 は , Yes, No で 答え られ る ほど 単純 な も 
の で は あり ませ ん . 
筆者 は , この 質問 に 対し て ,「 ハー ド ウェ ア を 意識 し て アル ゴリ ズ 
ム を 記述 し , 設計 制約 や RTL の 構造 を 制御 する 属性 や オプ ショ ン を 
適切 に 指定 すれ ば , 人 手 で 作成 し た RTL 記 述 に 匹 英 する か , より 性 
能 の 高い RTL 記 述 を 合成 する こと が で きま す 」 と 答え て いま す . どの 
よう な ビヘイビア 記述 を 行っ て も , 良い RTL 記 述 が 合成 され る わけ 
で は あり ませ ん . 想定 し て いる RTL 設計 の 構造 を 意識 し て 記述 し , 適 
切な 設計 制約 条件 や ビヘイビア 合成 を 制御 する 属性 , お よび コマ ンド 
を 指定 する こと で , 初め て 良い RTL 記 述 が 生成 され る の で す . 
これ は , HDL を 用 いた 論理 合成 ツー ル の 場合 と 同じ だ と 思い ます . 
STAR 半導体 理工 学研 究 セ ンタ ー) が 発行 し て いる | RTL 設 計 ス タ 
イル ガイ ド 」 で は , 「 目標 と な る 構造 が 明確 な 場合 に は HDL で その 構 
造 を 明確 に 定義 する 」 と 記載 され て いま す . これ に は , 大 き な a1ways 
( process) ブ ロッ ク を 構造 が 明確 に な る よう に 複数 の ブロ ッ ク に 分 
割 し た り , 中 間 変 数 を 適切 に 使用 し た りす る こと が 含ま れ ま す .( RTL 
の ) HDL を 適切 に 記述 し な いと , より 良い 性 能 を 持つ ゲー ト ・ レ ベル 
回 路 を 合成 で き な い こと は , 今 で は 常識 で す . 
ビヘイビア 合成 の 場合 , HDL 設計 ほど 詳細 に 構造 を 定義 する 必要 


水 の 
9) 出力 処理 
出力 処理 の ステ ッ プ で は , アロ ケー ショ ン と バイ ン デ ィ 
ング の 結果 に 基づい て RTL 記 述 を 生成 し ます . SystemC 
の RTL 記 述 を 生成 し た 場合 は , SystemC の テス ト ベン チ 

と いっ し ょ に 生成 後 の RTL 記 述 を シミ ュ レ ーション で きま 
す . 一 方 , 論理 合成 可能 な Verilog HDL また は VHDL の 
RTL 記 述 を 生成 し た 場合 は , 論理 合成 お よび レイ アウ ト の 
工程 へ と 進む こと が で きま す . SystemC と HDL の 混在 に 
対応 し た シミ ュ レ ー タ が あれ ば , SystemC の 環境 の 中 で , 
生成 し た HDL の RTL 記 述 を シミ ュ レ ーション する こと も 
可能 で す . 

図 7 の バイ ン デ ィング の 結果 か ら RTL 記 述 を 生成 し た と 
き の RTL 設 計 の 構造 を 図 8 に 示し ます . 図 中 の マル チ プ レ 
クサ の セレ クト 信号 は ステ ー ト ・ マ シン 部 か ら 出 力 さ れ , 
ステ ー ト ・ マ シン が 制御 する 処理 順 育 に 従っ て 演算 が 実行 
され ます . 

また , 出力 処理 の ステ ッ プ で は RTL 記 述 の 生成 と と も 
に , 使用 され た 演算 リソー ス や 面積 , 実現 され た レイ テン 


=term で に まる 


ヘイ ビジ 合成 只 央 


/// 


ビヘイビア 合成 で 生成 し た RTL 記 述 の 品質 は 設計 者 が 作成 し た RTL 記 述 に 匹敵 する か 


は あり ませ ん . し か し , 適切 な デー タ 幅 の 指定 , 冗長 式 の 簡略 化 , 並 
列 処理 の 指定 , 配列 や ルー プ の 展開 , 関数 の 共有 化 な ど を 行う 必要 が 
あり ます . 

ビヘイビア 合成 で 生成 し た RTL 記 述 と 設計 者 が 人 手 で 作成 し た RTL 
記述 の 性 能 の 比較 は 興味 深い 問題 だ と 思い ます が , これ は , 実際 に 比 
較 で きる RTL の 設計 資産 が 存在 する か ら 可能 な 議論 で ある と も 言え 
ます . 論理 合成 ツー ル が 実 設計 に 使わ れ 始 め た 当初 , 人 手 設計 に よる 
ゲー ト ・ レ ベル 回 路 と の 面積 比較 が よく 行わ れ ま し た . し か し , 比較 
する べき ゲー ト ・ レ ベル の 回 路 が まだ な い 新 し い 設 計 プ ロジ ェクト に 
論理 合成 ツー ル が 使わ れ 始 め る と , 面積 比較 は あま り 話題 に な ら な く 
な り ま し た . 

ビヘイビア 合成 に 対す る 信頼 が 高まり , 新しい 設計 プロ ジェ クト に 
適用 され る よう に な れ ば , 既存 の RTL 記 述 と の 性 能 比較 は 問題 に な 
ら な く な る と 筆者 は 考え て いま ず も ちろ ん , ツー ル に 対し て 適切 な 
制御 が な され る こと が 前 提 の 話 だ が …). 現状 の ビヘイビア 合成 は , 
よう やく 実用 レベ ル に 達し て きた 段階 と 言え を ます. まだ まだ 機能 拡張 
が 必要 な 部 分 が 多く あり ます . 

し か し , ビヘイビア 合成 を 用 いた 大 き な メ リッ ト で ある 抽象 度 の 向 
上 に よる 設計 期間 の 短縮 , 検証 の 効率 化 , 設計 資産 の 再 利 用 ハー ド 
ウェ ア と ソフ ト ウェ ア の 協調 設計 な どの 効用 が 認知 され る よう に な れ 
ば , 徐々 に , 尋 存 の HDL 設計 か ら の 移行 が 進む と 考え て いま す . 


シ な どの レ ポー ト が 出力 され ま す . 

今回 説明 し た ビヘイビア 合成 の 基本 的 な フロ ー と 処理 ス 
テッ プ は , 実は SystemC と いう 言語 その も の と は 特に 関係 
は あり ませ ん A( HDL の ビヘイビア 合成 ツー ル も , 処理 内 容 
は ほとん ど 同 じ ). ビヘイビア 合成 で は , タイ ミン グ 制 約 に 
従っ て スケ ジュ ー リ ング を 実行 し , クロ ッ ク ・ サ イク ル を 
割り 付 る と いう こと を 理解 し て いた だ けれ ば と 思い ます . 
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